Claramente, las cuatro matrices obtenidas se aproximan a la matriz que tiene como filas (de arriba a abajo) a los vectores can\'onicos (con cambio de signo) $e_3$, $e_2$, $e_1$ y $e_4$, es decir, a alguna matriz de la forma:

$w*$=\begin{math}
\left(\begin{array}{cccccc} 
   0  &  0  &  \pm1  & 0 &  0  &  0\\
   0  &  \pm1  &     & 0 &  0  &  0\\
   \pm1  &  0  &  0  & 0 &  0  &  0\\
   0  &  0  &  0  & \pm1 &  0  & 0
\end{array}
\right)
\end{math}

La raz\'on por la que esto es as\'i se encuentra analizando la matriz de varianzas y covarianzas. Tener un vector aleatorio de seis dimensiones distribuido en un rect\'angulo es lo mismo que tener seis variables aleatorias independientes distribuidas, cada una, en el lado del rect\'angulo correspondiente (esta propiedad se ve en un curso de Probabilidades). De hecho, es de este \'ultimo modo que nosotros generamos el vector aleatorio.

Ahora, entre dos variables independientes la covarianza es cero, luego la matriz de varianzas y covarianzas ser\'a diagonal. Por esto, sus autovectores ser\'an los vectores can\'onicos multiplicados por cualquier escalar. En particular, como las k-componentes principales son autovectores de norma 1 asociados al k-\'esimo autovalor (ordenados los autovalores de mayor a menor), ser\'an \'estas de la forma $\pm e_i$ para $i=1..6$.

El teorema de convergencia de Sanger nos dice que la matriz de pesos $w$ debe tener en sus $m$ filas ($m$ es el tama\~no del output) a las primeras $m$ componentes principales de la matriz de varianzas y covarianzas de la distribuci\'on que siguen las variables input. En este caso, tenemos convergencia a los siguientes (en orden de arriba a abajo, salvando el signo): $e_3$, $e_2$, $e_1$ y $e_4$, lo cual quiere decir que el valor m\'as alto de la matriz de varianzas y covarianzas es el tercero, que el segundo m\'as alto es el segundo y as\'i sucesivamente. Ahora, ?`esto era as\'i? ?`Cu\'ales son los elementos de nuestra diagonal? Son por definici\'on, la varianza de cada coordenada de nuestro vector aleatorio. Ahora, cada coordenada $i$ es una variable uniformemente distribuida en el intervalo $[-a_i,a_i]$, luego su varianza ser\'a $\frac{a_i^2}{3}$, con lo cual los autovectores m\'as altos ser\'an los que correspondan a las coordenadas con lados $a_i$ m\'as altos. En particular, nosotros hicimos el test sobre el rec\'angulo $[-4,4]\times[-5,5]\times[-6,6]\times[-3,3]\times[-2,2]\times[-1,1]$. Luego, las coordenados ordenadas de mayor a menor varianza ser\'an: 3, 2, 1, 4, 5, 6. Esto explica que las cuatro primeras componentes principales estuvieran dadas por (en orden): $e_3$, $e_2$, $e_1$, $e_4$.

Ahora,  qu\'e pasa si hay dos coordenadas que toman su valor en un intervalor de la misma amplitud (es decir, $a_i=a_j$ para $i\neq j$)? En primer lugar, la matriz diagonal va a tener un autovalor repetido, o sea, el subespacio asociado a ese autovalor va a tener dimensi\'on 2. Lo que observamos al testear el algoritmo con un rect\'angulo dado por [4 6 6 3 2 1] es que siendo el autovalor m\'as alto ($\frac{6^2}{3}=12$) repetido, las dos primeras filas de la matriz de pesos devuelta convergen a dos vectores distintos (y ortonormales) cualesquiera sobre el subespacio de dimensi\'on dos asociado a ese autovalor, en este caso, el subespacio generado por $<e_3,e_2>$ (es decir, el subespacio de los vectores con todas las coordenadas cero salvo la segunda y la tercera). Mostramos la matriz devuelta por dos corridas de mil iteraciones (al ser corridas distintas, tienen conjuntos de entrenamiento distintos):

$w_1$=\begin{math}
\left(\begin{array}{cccccc} 
   -0.0666 &   0.9256 &   0.3678 &   0.0408 &  -0.0436 &   0.0012\\
    0.0660 &  -0.3338 &   0.9374 &   0.0593 &  -0.0349 &  -0.0277\\
    0.9992 &   0.0166 &  -0.0281 &  -0.0132 &   0.0047 &  -0.0166\\
    0.0251 &   0.0831 &   0.1039 &  -0.9672 &   0.2149 &  -0.0067
\end{array}
\right)
\end{math}

$w_2$=\begin{math}
\left(\begin{array}{cccccc} 
    0.0374 &   0.8578 &   0.5046 &  -0.0710 &   0.0540 &   0.0151\\
   -0.0744 &  -0.5658 &   0.8207 &  -0.0239 &  -0.0029 &  -0.0160\\
    0.9954 &  -0.0253 &  -0.0320 &  -0.0857 &  -0.0047 &   0.0094\\
   -0.0415 &  -0.0031 &   0.0202 &  -0.9642 &   0.2608 &  -0.0148
\end{array}
\right)
\end{math}

Es bastante claro que en ambos casos las dos primeras filas llevan todas sus coordenadas distintas de la segunda y de la tercera a cero, pero las coordenadas segundas y terceras pueden ir, b\'asicamente, a cualquier lugar.
